Formule de la droite de régression

L’erreur commise en évaluant approximativement la valeur observée yi par l’ordonnée du point d’abscisse xi appartenant à la droite d’équation y = b x + a est égale à :

ei = yi – [b xi + a]

On cherche les coefficients b et a tels que la somme des carrés des erreurs soit la plus petite possible. On a :

 

 

n

 

S(a,b)

=

S

( yi – [ b xi + a] )2

 

 

i = 1

 

La fonc S(a,b) est un polynôme du second degré en a et en b dont les facteurs sont positifs :

( yi – [ b xi + a] )2

= yi2 + [ b xi + a]2  2 [ b xi + a] yi

 

= yi2 +  xi2 b2 + a2 + 2 xi a b – 2 b xi yi – 2 a yi

 

= a2 + 2 [ xi b – yi ] a + yi2 +  xi2 b2 – 2 b xi yi

La somme S(a,b) est de la forme :

 

n

 

n

 

S(a,b) = n a2 + 2 a

S

(xi b – yi) +

S

[ yi2 + xi2 b2 – 2 b xi yi ]

 

i = 1

 

i = 1

 

Le paramètre b étant fixé, l’extremum de ce polynome du second degré en a est atteint pour :

 

1

n

 

a = –

___

S

(xi b – yi)

 

n

i = 1

 

 

 

1

n

 

1

n

 

 = –

b

___

S

xi +

___

S

yi

 

 

n

i = 1

 

n

i = 1

 

 = –

[b

mx

my ]

 

 

 

On obtient :

a = my – b mx

Le facteur de a2 est égal à n ; il est positif. L’extremum est donc un minimum. On ordonne maintenant S(a,b) suivant les puissances décroissantes de b. On obtient encore un trinôme du second degré :

( yi – [ b xi + a] )2

= yi2 +  xi2 b2 + a2 + 2 xi a b – 2 b xi yi – 2 a yi

 

= xi2 b2 + 2 [ xi a –  xi yi ] b + yi2 +  a2 – 2 a yi

La somme S(a,b) est de la forme :

 

n

 

n

 

 

n

 

S(a,b) = b2

S

xi2 + 2 b 

S

[xi a –  xi yi ]

+

S

[yi2 +  a2 – 2 a yi]

 

i = 1

 

i = 1

 

 

i = 1

 

 


Le minimum de S(a,b) par rapport à b est atteint en :

 

n

 

 

S

[xi a –  xi yi ]

 

i = 1

 

b = – 

 

 

n

 

 

S

xi2

 

i = 1

 

On remplace le paramètre a par sa valeur en fonction de b :

 

n

 

 

n

 

b 

S

xi2

= –

S

[xi ( my – b mx) –  xi yi ]

 

i = 1

 

 

i = 1

 

Le second membre (changé de signe) est égal à :

n

 

 

 

n

 

n

 

S

[xi ( my – b mx) –  xi yi ]

=

( my – b mx)

S

xi 

S

xi yi

i = 1

 

 

 

i = 1

 

i = 1

 

 

 

 

 

 

 

n

 

 

 

=

( my – b mx)

n mx

 

S

xi yi

 

 

 

 

 

 

i = 1

 

 

 

 

 

 

 

n

 

 

 

=

– n b mx2 +

n mx my

 

S

xi yi

 

 

 

 

 

 

i = 1

 

On obtient finalement :

 

n

 

 

 

 

n

 

b [

S

xi2

n mx2 ]

=

S

xi yi – n mx my

 

i = 1

 

 

 

 

i = 1

 

 D’où finalement, en divisant chaque membre par n :

b = cov (x,y) / sx²